标签专题 · 共 2 篇文章

# KV Cache

关于「KV Cache」的技术文章、设计资料与工程师讨论,持续更新。

2
篇文章
7
人关注
133
次浏览
华为DCS AI解决方案全面支持DeepSeek-V4

华为DCS AI解决方案全面支持DeepSeek-V4

4月24日,DeepSeek-V4预览版正式推出并开源,将模型上下文窗口提升至1M,并引入KV Cache滑窗与压缩算法,有效缓解Attention计算复杂度与访存带宽压力,智能体能力大幅提高,在长序列推理与复杂任务处理中的表现更加高效与稳定,但新模型对基础设施也提出了新的挑战。华为DCS AI解决方案集成华为AI软硬件产品,发挥全栈优势,针对DeepSeek-V4进行深度适配,完成系统级优化和易

手机推理快8倍、80页合同AI秒懂——小米AI团队多项论文入选ACL 2026

手机推理快8倍、80页合同AI秒懂——小米AI团队多项论文入选ACL 2026

同样的GPU,推理速度提升8.3倍;80页合同,AI不用OCR就能读懂并回答问题——这些不是实验室PPT,而是小米AI团队刚拿到ACL 2026录用的7篇论文背后的真实技术突破。 ACL(Annual Meeting of the Association for Computational Linguistics)是计算语言学与自然语言处理领域国际公认的顶级学术会议,CCF-A类。本届会议将于20